home *** CD-ROM | disk | FTP | other *** search
/ Monster Media 1996 #15 / Monster Media Number 15 (Monster Media)(July 1996).ISO / os2 / pms_103.zip / PMSTRIP.DOC < prev    next >
Text File  |  1996-04-25  |  12KB  |  327 lines

  1.   
  2.                           PMStripper 1.03
  3.  
  4.  
  5. I. Overview:
  6.  
  7.  
  8. This PM shareware utility strips HTML codes from Web pages,
  9. leaving only the text.  Some of the page's formatting is
  10. retained, but since PMStripper is not an HTML interpreter most
  11. formatting is lost.  While the layout of tables and lists is lost
  12. during stripping, data is sorted to separate lines for
  13. legibility.
  14.   
  15. PMStripper is designed to provide a quick conversion of HTM/HTML
  16. coded files into plain ASCII text.  Although the converted files
  17. can be edited while loaded in PMStripper, only simple edit
  18. commands are available.  Therefore, if extensive editing is
  19. needed, the text should be loaded into a more capable word
  20. processor or text editor.
  21.  
  22. One use of PMStripper would be to convert a Web page so that the
  23. a spell checker can be used without adding all of the HTML codes
  24. and links to the spelling dictionary.
  25.  
  26. The registered version offers a menu item to easily move stripped
  27. files to programs suited for advanced editing.
  28.  
  29.  
  30.  
  31. II.  Installing PMStripper:
  32.  
  33.  
  34. 1) Unzip the archive.
  35.  
  36. 2) If REXX is installed:  Run the INSTALL.CMD script from an OS/2
  37. command prompt, or by double clicking on the install file's icon.
  38.         
  39. The script will create a destination directory and transfer
  40. program files to it.  Optionally, you may use the unzip directory
  41. as the working directory.  In either case the script will create
  42. a PMStripper program object on the desktop and set file
  43. associations for .HTM and .HTML files.  Setting associations this
  44. way allows instant loading, and stripping, of saved web pages by
  45. double clicking their icons.
  46.  
  47. If the install program cannot create the desired directory, just
  48. move all unzipped files to the working directory before running 
  49. the install program.
  50.   
  51. 3) If REXX is not installed:  Unzip the archive in the desired
  52. working directory and manually:  a) Create a desktop program
  53. object, and b) Set .HTM and HTML associations.  (See OS/2
  54. documentation for instructions, if needed.)
  55.  
  56.  
  57.  
  58. III.  Files
  59.  
  60.  
  61. PMStripper is distributed in the compressed archive PMSR_xxx.zip,
  62. where xxx is the version number.  The archive contains these
  63. files:
  64.  
  65.  
  66. NAME              SIZE          DESCRIPTION
  67.  
  68. FILE_ID.DIZ        434    File descrption for BBS use.
  69. INSTALL.CMD       2326    Install script.
  70. LICENSE.TXT       4465    License.
  71. LICENSE.UNH       4476    License for UNH
  72. ORDER.BMT         3708    BMT Micro order form
  73. PMSTRIP.DOC      11831    This file.
  74. PMSTRIP.EXE     452608    Program executable.
  75. PMSTRIPR.ICO       874    Program icon.
  76. PMSTRIPB.ICO       874    Program icon.
  77. README.UNH        1503    Information file for unh.exe. 
  78. TIPS              1243    Tips on using PMStripper
  79. UNH.EXE          41984    Command line stripper.
  80.  
  81.  
  82.  
  83. IV.  Uninstalling PMStripper:
  84.  
  85.  
  86. If you find it necessary to remove PMStripper, simply delete the
  87. unzipped files, program object, associations and directory.
  88. PMStripper makes no entries in configuration or initialization
  89. files.
  90.  
  91.  
  92.  
  93. V. Using PMStripper
  94.  
  95.  
  96. PMStripper is a simple program with only five menu bar items:
  97.   
  98. 1. 'File' offers three pull-down menu item:  'Open File', 'Save As'
  99. and 'Exit'.  Each perform in a standard OS/2 manner. Picking a 
  100. saving file name is easy: Highlight some text for the name and 
  101. then click on 'Save As', or simply highlight and Alt+S.
  102.  
  103. The 'Open File' selection can also be used to reload the HTML
  104. file if you make a change in the processing options.
  105.  
  106. The utility will also load HTML coded files for stripping via
  107. drag and drop of the file's icon onto that of the PMStripper.
  108. However, the capability to load files by drag and drop onto an
  109. open edit window is a potential enhancement, for a future
  110. version.
  111.  
  112.  
  113. 2. 'Edit' has five sub-menu items which also operate as expected.
  114. They are 'Cut', 'Copy', 'Paste', 'Select All' and 'Undo Change'.
  115. The 'Undo Change' selection will undo the last change made to
  116. the text in the window and is only one level deep.
  117.  
  118.   
  119. 3. 'Options' has five sub-menu items. They are 'Display Options',
  120. 'URL Settings', 'External Editor Settings', 'Filename Settings'
  121. and 'Save Settings'.
  122.  
  123. 'Display Options' has two sub-menu items. They are 'Font' and
  124. 'Word Wrap'. 'Font' brings up a standard OS/2 font dialog box
  125. and will allow the selection of any of the installed fonts.
  126. 'Word Wrap' is a toggle setting that turns word wrap on or off.
  127. The wrap function does not actually reformat the text, instead
  128. it effects only the way text is displayed.
  129.  
  130. 'URL Settings' has two sub-menu items. They are 'Add URLs' and
  131. 'Leave URLs'. These options effect how the HTML file is processed
  132. and the file must be reloaded for these changes to effect current
  133. file.  'Add URLs' appends the URLs found in the HTML file to the
  134. end of the stripped text.  'Leave URLs' leaves the URLs found in
  135. the HTML file in the stripped text.
  136.  
  137. 'External Editor Settings' has two sub-menu items.  They are
  138. 'Use __TMP2__ File' and 'Use Clipboard'.  'Use __TMP2__ File'
  139. causes the temporary file __TMP2__ to be left in the working
  140. directory for use by an external editor.  'Use Clipboard'
  141. causes the stripped file to be copied to the OS/2 clipboard
  142. when the user selects 'Exit to Word Processor'.  These 
  143. option settings are only effective in the registered version.
  144.  
  145. 'Filename Settings' has two sub-menu items. They are
  146. 'Replace Space with Underscore Character' and 
  147. 'Leave Space in Filename'.  These settings are used to
  148. determine how the highlighted text is converted to a
  149. destination file name for the stripped HTML file.  These
  150. option settings are only effective in the registered version.
  151.  
  152. 'Save Settings' saves all of the option settings to an INI
  153. file named PMSTRIP.INI which is located in the working 
  154. directory.  The display options are not part of the saved
  155. settings and the utility reverts to word wrap on and the
  156. default font when loaded.
  157.  
  158.   
  159. 4. 'Exit' has two sub-menu items.  They are 'Exit' and
  160. 'Exit to ~Word Processor'.  'Exit' causes the stripped
  161. file to be discarded and PMStripper to close. 
  162. 'Exit to ~Word Processor' causes the OS/2 CMD file
  163. PMS_CMD.CMD to be executed and PMStripper to close. The
  164. 'Exit to ~Word Processor' option is only effective in the
  165. registered version.  
  166.  
  167.  
  168. 5. 'About' displays copyright and contact information.
  169.  
  170.  
  171.  
  172. VI.  The active keyboard accelerators (short cut keys) are:
  173.  
  174.         Exit            Alt+X
  175.         Copy            Ctrl+Insert
  176.         Cut             Shift+Delete
  177.         Select All      Ctrl+/
  178.         Open File       Alt+F
  179.         Paste           Shift+Insert
  180.         Save As         Alt+S
  181.         Word Processor  Alt+W
  182.         Undo Change     Alt+U
  183.  
  184. The keyboard accelerators are not case sensitive.
  185.  
  186.   
  187. VII.  Miscellaneous Notes:
  188.   
  189.  
  190. When dragging a file from WebExplorer the file must be dropped on
  191. the desktop (or in a folder) before it can be dropped on the
  192. PMStripper program object.
  193.  
  194. This utility will only run on OS/2 Warp and later releases.
  195.  
  196. One useful feature is the ability to mark text in the stripped file
  197. and use the highlighted text as the file's 'Save As' name. This
  198. is very useful if you have HPFS formatted drives.  NOTE: Spaces
  199. and some punctuation characters are converted to "_" characters
  200. in the file name unless the option to use spaces is selected. Then
  201. any converted characters are converted to spaces. The "/" and  "\"
  202. characters are deleted and not replaced.  This feature is only
  203. activated in the registered version of PMStripper.
  204.  
  205. The HTML specification defines Character Entity Sets or tags
  206. to represent particular graphic characters which have special
  207. meanings in places in the markup, or may not be part of the
  208. character set available to the writer. PMStripper does not
  209. attempt to scan for all of the possible tags, but does try to
  210. resolve the most common tags. 
  211.  
  212. This version of PMStripper has support for codepages 437 and 850
  213. and if codepage 850 is in use, the 850 character set is used.
  214. The codepages only make a difference when  &xxxx; tags are
  215. present in the file. If the correct character or an acceptable
  216. alternate is not available or the tag is unknown to PMStripper,
  217. then the &xxxx; tag will be left in the file.  
  218.  
  219. Only a few of the &#nnn; tags are supported.  They do not seem to
  220. be widely used and scanning for all of them will increase the time
  221. it takes to process an .HTML or .HTM file.
  222.  
  223.  
  224. VIII.  Why & How to Register:
  225.  
  226.  
  227. The Word Processor option runs the PMS_CMD.CMD file located in
  228. the working directory specified in the Program Object.  This file
  229. is used to start the word processor or editor of your choice to
  230. edit the stripped text file named __TMP2__ or to allow you to
  231. paste the stripped file into your editor.  PMStripper will
  232. close after the executing the PMS_CMD.CMD file. 
  233.  
  234. NOTE:  The __TMP2__ file is discarded if PMStripper is closed
  235. via the the 'Exit' menu item.  Double clicking the PMStripper's
  236. upper left corner, using Alt+F4 or selecting that menu's 'Close'
  237. may cause the temporary stripped file (named __TMP2__ ) to remain
  238. in the working directory.  
  239.  
  240. This menu item is disabled in the unregistered version.  Instead
  241. of invoking the command script an unregistered message requiring
  242. a user response will be shown.
  243.  
  244.  
  245. Example PMS_CMD.CMD files:
  246.   
  247. To use the system editor E.EXE, the PMS_CMD.CMD file would
  248. contain:
  249.  
  250.         E __TMP2__
  251.   
  252. To use a word processor or editor whose executable is not in the
  253. path, the command script must copy the __TMP2__ file to the
  254. desired program's data directory, change to that directory and
  255. then launch the word processor/editor.  An example PMS_CMD.CMD
  256. file to use DeScribe is shown below.
  257.  
  258.         copy __TMP2__ g:\describe\__TMP2__ 
  259.         g:
  260.         cd \describe 
  261.         describe __TMP2__
  262.  
  263. In addition to the activation of the Word Processor option,
  264. the opening unregistered message requiring a user response
  265. is eliminated along with the unregistered line that is
  266. inserted at the top of the stripped file. 
  267.  
  268. Registered users are supported via e-mail. Send help requests and 
  269. good ideas to me at dwhawk@southwind.net. 
  270.  
  271. There are two places to register PMStripper. Through BMT Micro and
  272. directly with the author. 
  273.  
  274. Registration through BMT Micro:
  275.  
  276. BMT Micro will accept credit cards and will be more convenient for
  277. OS/2 users outside the United States. BMT Micro's price to register
  278. PMStripper is $9.95 (US Dollars).  BMT Micro also has an FTP area
  279. where the registered version can be obtained after registration.
  280.  
  281.  
  282. Direct registration:
  283.  
  284. Stuff small bills, gold coins, diamonds or even checks (US banks only,
  285. please) valued at $7.50 (US dollars) into an envelope and mail to:
  286.  
  287.         Don Hawkinson 
  288.         4555 N Hillcrest
  289.         Wichita KS, 67220-3832
  290.  
  291.  
  292. Please don't send $100 bills (or larger) in the mail without 
  293. purchasing full postal insurance. Also, no change will be 
  294. returned because it is absolutely unsafe, and unwise, to send 
  295. cash through the mail.
  296.  
  297. The registered version of PMStripper will be distributed by e-mail
  298. in the form of a uuencoded zip file, so make certain that your
  299. e-mail address is included with your registration fee.
  300.  
  301. Registered users will be notified of updates via e-mail.
  302.  
  303.  
  304. IX. Acknowledgments:
  305.  
  306.  
  307. Thanks to the following netizens for their help in testing
  308. and helpful comments during development.
  309.  
  310. DenverD@ibm.net
  311. Emil_Kucera@Environment.gov.MB.CA 
  312. fvlaming@netcom.com
  313. jhiatt@ibm.net
  314. jlink@best.com
  315. p_daley@conknet.com
  316. tombeck@usemail.com
  317.  
  318. Thanks to a net WordSmith (WrdSmth@IBM.net) for editing help.
  319. (Actually he converted my very rough draft to this document.)
  320.  
  321.  
  322. Copyrights and trademarks remain the property of their owners.
  323.  
  324.  
  325. Don Hawkinson 
  326. dwhawk@southwind.net
  327.